확률과 통계: 불확실성의 과학: 확률에서 가능도로: 추론의 과학

통계적 추론은 알려진 매개변수(확률)에 기반해 결과를 예측하는 것에서, 관찰된 데이터와 가장 일치하는 매개변수를 결정하는 것으로 전환됩니다(가능도). 확률 밀도 함수 $f(x|\theta)$는 고정된 $\theta$에 대해 데이터 $x$의 분포를 설명하지만, 가능도 함수 $L(\theta|x)$는 관찰된 데이터를 고정하고 매개변수 $\theta$를 변화시켜 다양한 가설에 대한 상대적인 지지 정도를 측정합니다.

역전 원리

가능도 함수는 종종 결합 밀도 형태로 표현됩니다. 고정된 분산을 가진 정규분포의 경우, 가능도는 다음과 같이 정의됩니다:

$L ( \theta | x_1, \dots, x_n ) = \exp\left( -\frac{n}{2\sigma_0^2} (\bar{x} - \theta)^2 \right)$

여기서는 표본 평균 $\bar{x}$가 주어졌을 때, 서로 다른 $\theta$ 값의 "타당성"을 평가합니다. 이 타당성의 최고점(피크)을 찾기 위해 우리는 정의 6.2.2: 로그 가능도 $l(\theta | s) = \ln L(\theta | s)$를 사용합니다. 이 변환은 독립적인 관측값들의 곱을 합으로 바꾸어, 복잡한 모델의 최대화를 계산적으로 가능하게 합니다.

실제 사례: 키 조사 (예제 6.3.5)

데이터

표본 크기가 $n=30$이고, 계산된 표준편차가 $s=2.379$인 키 데이터를 고려합니다. 위치-척도 정규모형을 사용하여 진짜 평균 $\theta$를 추정하려고 합니다.

추론 및 정밀도

표준오차는 $s/\sqrt{30} = 0.43434$로 계산됩니다. 이 값은 우리의 가능도 피크의 "예리함"을 측정합니다. 더 작은 표준오차는 더 좁고 날카로운 피크를 의미하며, $\theta$에 대한 추론의 정밀도가 높음을 나타냅니다.

차원과 제약 조건

복잡한 상황, 예를 들어 예제 6.1.5 (다항모형)에서는 논리적 의존성을 고려해야 합니다. 언급된 바와 같이, "어떤 두 개의 $\theta_i$ 값이 알려지면 나머지 매개변수의 값도 즉시 알 수 있다"는 점을 인식해야 합니다. 이 제약조건은 매개변수 공간 $\Omega$를 올바르게 정의하는 데 필수적입니다.

점근적 기초

가능도에서 추론으로 넘어가는 다리는 중심극한정리에 의존합니다. $n \to \infty$일 때, 우리의 추정량의 분포는 수렴합니다. 특히, 예제 6.5.4 베르누이 모형:

$Z = \frac{\sqrt{n}(\bar{X} - \theta)}{\sqrt{\bar{X}(1 - \bar{X})}} \xrightarrow{D} N(0, 1)$

이는 충분히 큰 표본을 갖는 경우, z구간과 p값을 사용해 불확실성을 정량화할 수 있게 해줍니다.

🎯 핵심 원리

분포에 의존하지 않는 통계적 추론 방법은 표본 분포에 대한 최소한의 가정만 필요하며, 가족 $\{P_{\theta} : \theta \in \Omega\}$이 매우 클 경우 강건합니다. 반면, 파라메트릭 가능도 방법은 로그 가능도의 곡률에 의존하며, 피셔 정보 $nI(\theta)$가 스코어 함수의 분산을 결정합니다.

질문 1

6.1.2: 한 사람 연도당 자살 발생률이 $p$라고 가정합니다 (포아송($Np$)). $N=30,345$ 명년 동안 22명의 자살 사례를 관찰했을 때, 로그 가능도 함수 $l(p)$는 무엇입니까?

$l(p) = -30345p + 22\ln(p) + C$

$l(p) = 30345\ln(p) - 22p + C$

$l(p) = e^{-30345p} p^{22}$

$l(p) = -22p + 30345\ln(p)$

질문 2

6.3.14: $\psi(\theta)$에 대한 95% 신뢰구간은 $(1.23, 2.45)$입니다. $H_0 : \psi(\theta) = 2$에 대한 증거가 있습니까?

아니요, 왜냐하면 2가 구간 내에 있기 때문입니다.

네, 왜냐하면 2가 구간의 중심이 아니기 때문입니다.

네, $\alpha=0.01$ 수준에서 그렇습니다.

결론을 내리기에 정보가 부족합니다.

질문 3

$N(\mu, \sigma^2)$의 3번째 모멘트를 확인하세요. 다음 중 $\mu_3 = E_{\theta}(X^3)$를 나타내는 식은 무엇입니까?

$\mu^3 + 3\mu\sigma^2$

$\mu^3 + \sigma^3$

$3\mu^2\sigma + \mu^3$

$\mu^3 + 3\sigma^2$

질문 4

6.5.1: $\mu_0$가 알려진 상태에서 $x_1, \dots, x_n \sim N(\mu_0, \sigma^2)$라면, 피셔 정보 $I(\sigma^2)$는 얼마입니까?

$1 / (2\sigma^4)$

$1 / \sigma^2$

$n / (2\sigma^2)$

$2\sigma^4$

질문 5

k개 카테고리의 다항모형(예제 6.1.5)에서 매개변수 공간의 효과적 차원은 얼마입니까?

$k - 1$

$k$

$k^2$

$1$